基于LSTM模型的广告库存预估算法
导语
背景
解决方案
最初的传统时序预测,可以追溯到移动平均法、指数平滑法,这类方法基于某段时间的历史数据拟合曲线,对于周期性的波动或方差较大的数据模拟效果较差;之后,随着移动平均与自回归的ARMA,ARIMA等模型出现,时序预测与此相结合。ARIMA模型[1],全称差分整合移动平均自回归模型,其中AR是自回归,I为整合,MA为滑动平均,模型主要采用三个参数分别表示时序数据的滞后数、达到稳定状态需要的差分阶数、预测误差的滞后数。[1] 该模型简单易实现,对近期数据波动规律捕捉较好。但是ARIMA模型要求观测数据本身或是其差分后的数据是稳定的,且模型重点关注内生变量,不易添加外部特征,尤其与时序关联较小的特征。
随着人工智能的发展,机器学习方法开始普及,SVM、XGBoost等方法也被运用于时序预测任务中。深度学习作为机器学习中的一种被不断提及,其中,循环神经网络RNN逐渐被证明在时序预测中能获得较好的效果,在捕捉长期数据规律上更有不错的表现。
在调研LSTM算法模型之前,爱奇艺广告算法团队采用Adaptive-ARIMA模型(后文简称为A-ARIMA模型),进行广告库存预估。A-ARIMA模型将传统ARIMA算法和库存预估背景相结合,主要流程如下:
其中,A-ARIMA算法对于传统ARIMA的改进主要在于缺失值、异常值等处理,另外,在后续处理时加入了进出节假日及周末的预估偏差矫正,以更好地描述实际流量波动。实验结果显示:在库存预估场景下,A-ARIMA模型较传统算法预测效果更好,偏差率下降1.16pp。
LSTM(Long short-term memory,长短期记忆)模型[2],属于RNN(Recurrent neural network,循环神经网络)模型的一种,在长序列预测过程中相比普通RNN有更好的效果。在确定采用LSTM模型作为基础网络模型后,需要构建基本数据集:以过去N天的历史库存数据作为训练集,设置时间滑动窗口为t,则每个维度每t天的数据可作为一个训练样本,而随后的一天数据则作为标签值,同时,为了保证参数训练方向的随机性,在选择训练样本时,我们采用随机选取样本的方式,而不是将单一维度的样本依次放入训练。LSTM整体网络结构如下:
· 数据归一化
数据归一化是机器学习中的常见方法,在此进行归一化的主要原因是为了使得不同样本能训练同一组模型参数。具体针对这一问题,库存预估在不同维度下库存量级差距巨大,热门维度库存量可达到近千万,而部分维度则只有个位数的库存,而且同一维度下也可能存在库存水平随时间区间的变化而大幅浮动的情况。因此,在数据输入至LSTM网络前,需要对数据进行归一化。
· 维度聚类
正如库存预估业务特点中所描述,预估维度通常需要精确到站点、平台、城市、频道等维度。若对各维度采用相同参数的LSTM网络,模型则很难准确地描述各个维度;反之,如果每一个维度单独训练,样本数不够,模型将失去泛化性,且训练成本过大。
本文希望通过聚类的方法,选择波动趋势近似的维度组成同一类,进而训练相同的模型参数,因此,首先需计算IAE误差并完成层次聚类[3],组成所需数据集。
IAE(Integrated AbsoluteError) ,综合绝对误差,公式表示为:
t为时间周期,表示某时刻两条库存曲线之间的误差,由于实际问题中库存值不连续,体现为离散的点,故该公式可表示为:
从几何角度分析,该误差公式可理解为两条库存曲线相交部分的面积大小,以此表示维度之间的“距离”。得到各维度两两之间的“距离”后,可利用该结果进行聚类,聚类过程可视为将库存曲线波动趋势相似的维度放入同一类。
下图展示了两个类的聚类效果:
· 节假日特征
正如我们所预见,广告库存跟日期特征有很强的相关性:如下图所示,寒暑假、法定节假日、周末等日期的流量明显上涨,广告库存也大幅提升。由此可得,在模型中加入节假日特征能有效提升预测正确度。
通过在LSTM模型外增加了一层全连接层,将LSTM预测的输出与节假日特征拼接。在设置节假日特征的方法上,我们通过观察上图流量波动的特征,大致将日期分为普通工作日、节假日前一天、节假日等多种类别。
实验结果
实验数据表明:在维度加权偏差率方面,LSTM模型相较于A-ARIMA模型整体日均下降0.72pp。而在全维度总库存预估上, LSTM预测偏差率日均下降1.48pp,效果更为明显。基于以上实验结果,我们可以判断基于LSTM的广告库存预估算法较A-ARIMA算法有更好的预测效果。
总结与展望
1. 数据归一化:将各个维度历史库存数据归一化,并根据归一化后的结果聚类,在节省训练资源的同时,尽可能地构建更具泛化性的模型;
2. 预测日期精细化分多类标签:将普通工作日、普通节假日、节假日第一天等多类标签,embedding后与LSTM模型输出连接,体现出节假日特征对库存波动的影响。
参考文献
[2] Sepp Hochreiter, Jürgen Schmidhuber. 1997."Long short-term memory". Neural Computation. 9 (8): 1735–1780.doi:10.1162/neco. 1997.9.8.1735. PMID 9377276
[3] Marques Jp, Written; Wu YF, Trans. PatternRecognition Concepts. Methods and Application, 2nd ed. Beijing:Tsinghua University Press, 2002. 51-74.
end
干货|爱奇艺短视频质量评估模型
2019 ICME论文解析:爱奇艺首创实时自适应码率算法评估系统
扫一扫下方二维码,更多精彩内容陪伴你!